Урок 5 знаменует собой поворотный момент в COMP5511. Мы отходим от детерминированной логики классических вычислений и уверенности в результатах моделей ранней классификации, основанных на обучении с учителем, к вероятностному ядру генеративного ИИ. На этом занятии мы исследуем, почему современные модели ИИ выдают не "факты", а вероятностные распределения, раскрывая механизмы, позволяющие LLM писать стихи, а диффузионным моделям — рисовать из шума.
1. Смена парадигмы: от логики к вероятности
- Помимо «ЕСЛИ-ТО»: переход от жестких правил к гибким статистическим вероятностям.
- Конец определенности: понимание того, почему результаты GenAI по своей природе недетерминированы.
- Вероятность как инструмент: как «эпоха GenAI» рассматривает неопределенность как особенность, а не как ошибку, которую нужно исправить.
2. Вероятностные движки творчества
Генеративный ИИ полагается на выборку из многомерных вероятностных пространств. При генерации текста или изображений модель ориентируется в неопределенности, чтобы создавать новое:
- Большие языковые модели (LLM): предсказание следующего токена не как единичного выбора, а как распределения вероятностей.
- Диффузионные модели: искусство обратного инжиниринга порядка из хаотичного Гауссовского шума.
- Процесс выборки: как случайность используется для предотвращения повторяющихся и «роботизированных» выводов.
3. Агенты в непредсказуемых мирах
Автономные агенты должны ориентироваться в "открытых мирах", где каждое действие несет в себе степень неизвестного риска и вознаграждения.
Компромисс с галлюцинациями
Полностью детерминированные модели безопасны, но лишены оригинальности. Принимая неопределенность, мы позволяем творить, но также вносим риск галлюцинаций—когда модель уверенно генерирует правдоподобную, но ложную информацию.
Концептуальная логика выборки
1
Определить функциюGenerate_Response(
Prompt,Temperature)
:
2
Рассчитатьвероятностное распределение для всех возможных следующих токенов;
3
Скорректировать распределение в зависимости от Temperature(
Более высокая = большее разнообразие, Более низкая = большая сфокусированность)
;
4
Выбрать следующий токен с помощью взвешенного случайного выбора;
5
Повторять до завершения.
Вероятностное моделирование
Современный ИИ рассматривает мир через призму статистики, а не бинарных истин.